之前我們已學過了Series串連,本次是DataFrame串連,目標則是為了知道每個步驟中傳回確切物件。
使用isna()判斷是否為缺失值,其傳回為布林值
df1.isna()
執行結果:
蘋果 芭樂 香蕉 橘子 檸檬
小明 False False False False False
小美 False False False False False
小英 False False False False False
小玉 False True False True False
小翔 False False False False False
python中,布林值會表示成0和1,因此我們可以對布值林做數學運算
串連any()會顯示每個欄位是否存在缺失值
df1.isna().any()
執行結果:
蘋果 False
芭樂 True
香蕉 False
橘子 True
檸檬 False
dtype: bool
再次串連any(),則會顯示整個DataFrame是否存在缺失值。
df1.isna().any().any()
執行結果:
True
若想計算缺失值數量可用sum()
sum()處理一個欄位會會回傳單一數值,不同欄位則會整理回傳一個Series
計算每個欄位的缺失值數量
df1.isna().sum()
執行結果:
蘋果 0
芭樂 1
香蕉 0
橘子 1
檸檬 0
dtype: int64
計算整個DataFrame缺失值總數
df1.isna().sum().sum()
執行結果:
2
串連之後,是否更快找到自己要的資訊了呢~